TPAMI 2025 | 港科大 & 腾讯 VMNet:解决体素方法几何模糊痛点
你是否想过,当AI看到一个三维房间时,它是如何分辨出哪里是桌子、哪里是墙壁的?近年来,基于体素的三维语义分割方法一直是主流,但它们有个致命缺点——看不懂物体表面的"几何关系"。今天要给大家介绍的这项研究,就像给AI装上了"几何眼镜",让机器既能理解空间距离,又
你是否想过,当AI看到一个三维房间时,它是如何分辨出哪里是桌子、哪里是墙壁的?近年来,基于体素的三维语义分割方法一直是主流,但它们有个致命缺点——看不懂物体表面的"几何关系"。今天要给大家介绍的这项研究,就像给AI装上了"几何眼镜",让机器既能理解空间距离,又
近日,一篇发表于计算机视觉顶级期刊 TPAMI 的文章提出了一项为高效图像复原任务量身打造的深度学习模型,自适应稀疏 Transformer(AST-v2)模型。针对现有方法在性能与效率难以兼顾的问题,AST-v2 通过降低特征冗余、抑制无关区域的噪声交互,为